home *** CD-ROM | disk | FTP | other *** search
/ Cream of the Crop 26 / Cream of the Crop 26.iso / educate / trutran2.zip / ARTICLE1 < prev    next >
Text File  |  1996-12-14  |  23KB  |  463 lines

  1.  
  2.               *** PRESS ANY KEY TO SEE THE NEXT SCREEN ***
  3.  
  4.          If you wish to print this article or view it in its
  5.          entirety, please load it into your word processor
  6.                           as ARTICLE1.
  7.  
  8.                    *********************************
  9.                    *    For an overview of these   *
  10.                    *  articles, please first read  * 
  11.                    *     the file ARTICLE0.SEE     *
  12.                    *********************************
  13.  
  14.  
  15.            MT and Language: Conflicting Technologies?
  16.  
  17.  
  18.                       Ariadne's Endless Thread
  19.  
  20.                           By Alex Gross
  21.  
  22.           (Originally published in the Sci-Tech Translation 
  23.                         Journal, October, 1993)
  24.  
  25.           In a previous piece (Where Do Translators Fit Into
  26.      Machine Translation?), I sought to direct a variety of
  27.      philosophical, linguistic, and practical questions to
  28.      members of the MT community during one of their major
  29.      international conferences.  Since response to these
  30.      questions has been less than deafening, I would now like to
  31.      suggest a few possible answers and speculations of my own
  32.      concerning these matters.  Some bitterness has crept into MT
  33.      discussions of late, and so I would like to emphasize once
  34.      again that no reasonable person is opposed to MT where it
  35.      works.  The question is a more theoretical one, though rich
  36.      in practical applications, and concerns how far MT is truly
  37.      capable of improvement and why it has taken so long to reach
  38.      its present condition.  In this discussion I propose to deal
  39.      with both MT and human language as specific "technologies,"
  40.      an approach as obvious for the former as it may seem
  41.      surprising for the latter.
  42.      
  43.           It is not at all hard to show that MT comprises some
  44.      sort of technology.  The reduction of knowledge to bits and
  45.      bytes, the building of algorithms, the construction of
  46.      programs are all processes familiar to us from other
  47.      branches of computer technology.  And indeed MT was foreseen
  48.      from the beginning by such computer pioneers as Turing,
  49.      Shannon, and Weaver as a rich potential application.  Even
  50.      in commercial and practical terms, MT would appear at first
  51.      glance to have passed through all the usual stages common to
  52.      technologies:
  53.      
  54.           1.  Need (or perceived need).
  55.           2.  Determination of technological feasibility.
  56.           3.  Successful financing.
  57.           4.  Basic research and development.
  58.           5.  Preparation and testing of prototypes.
  59.           6.  Further improvements and developments.
  60.           7.  Launching of commercial products.
  61.           8.  Publicity and marketing.
  62.           9.  Operator or consumer training in their use.
  63.      
  64.           Nonetheless, a closer examination of these stages
  65.      reveals several points at which MT may have already fallen
  66.      short.  It can be argued, for instance, that the "need or
  67.      perceived need" for MT was never sufficiently demonstrated,
  68.      as no trustworthy figures have ever existed concerning the
  69.      actual or potential total world volume of materials needing
  70.      translation nor of the number or capabilities of human
  71.      translators ready to translate them, nor--finally--of the
  72.      real or potential economic benefits to be reaped from
  73.      introducing this new method.
  74.      
  75.           Further reservations may be expressed concerning the
  76.      basic "research and development" process out of which MT has
  77.      grown.  Essentially all "computational linguistics" has been
  78.      based in or grown out of the prior theorizing of
  79.      conventional linguistics.  But for some decades the study of
  80.      linguistics, never a rigorous science to begin with (despite
  81.      some efforts to make it one), has been subject to a process
  82.      of growing decadence and obfuscation.  This process has gone
  83.      so far that departments of Linguistics have recently been
  84.      disbanded at two major universities, and many scholars now
  85.      regard the field as even less respectable than sociology.
  86.      
  87.           Further discussion of the linguistic side will be
  88.      postponed until we have had a chance to consider whether
  89.      and, if so, how language itself may be considered to be a
  90.      technology.  Further objections as to how well MT has lived
  91.      up to three other stages in our profile--namely, launching
  92.      of commercial products, publicity and marketing, and
  93.      operator or consumer training--can also be voiced, but this
  94.      matter will also be overlooked for the time being.
  95.      
  96.           There are of course other computer-specific steps in
  97.      developing a technology--such as reverse engineering pre-
  98.      existing programs or the use of orphan code--which have
  99.      helped to speed up the development of applications in the
  100.      past, and in most fields we have also witnessed the effects
  101.      of economies of scale.  It is partly due to these last that
  102.      we have seen calculators shrink from desktop giants to the
  103.      size of visiting cards within our own lifetimes.  Comparable
  104.      developments in other fields have led many to suppose that
  105.      virtually anything is possible.
  106.      
  107.           At this point it is also important to note that MT is
  108.      most definitely--and perhaps most self-definingly--a
  109.      component part of AI, or Artificial Intelligence.  Certainly
  110.      the AI Community has done all within its power to encourage
  111.      funding sources and the general public to believe that
  112.      computers can do almost anything.  While MT advocates now
  113.      concede--at least among translators--that FAHQT (Fully
  114.      Automatic High Quality Translation) may never happen, the AI
  115.      Community at large has never made any such concession.  On
  116.      the contrary, at a recent conference its so-called HAL wing
  117.      proclaimed its allegiance to recreating full human
  118.      intelligence--including language comprehension--within a
  119.      computer.  This is not surprising news to those who have
  120.      lurked on Internet's comp.ai newsgroup.  FAHQT would of
  121.      course be a relatively simple task for such a computer,
  122.      assuming it could be built.
  123.      
  124.  
  125.           Now that we have seen how MT conforms--with some
  126.      apparent exceptions--to the overall pattern of a technology,
  127.      let us next examine the qualifications of human language in
  128.      this regard.  It is obvious from the beginning that any such
  129.      claims will have to be expressed in biological and
  130.      physiological terms, since human language did not develop in
  131.      the same way as technologies such as metallurgy or computer
  132.      science, even though the latter are arguably its offshoots.
  133.      
  134.           The long-debated origins of language--variously
  135.      attributed to the "Bow-Wow Theory," the "Yo-Heave-Ho
  136.      theory," or the "Pooh-Pooh Theory"--are so inauspicious and
  137.      unpersuasive that readers may wonder what point there can
  138.      be--like so much else in linguistics--to any further
  139.      discussion at all.  But once we turn our attention to
  140.      biological development, both of the species and of our
  141.      related animal cousins, a different perspective may unfold,
  142.      and some startling insights may just be within our view.  As
  143.      human beings we frequently congratulate ourselves as the
  144.      only species to have evolved true language, leaving to one
  145.      side the rudimentary sounds of other creatures or the dance
  146.      motions of bees.  It may just be that we have been missing
  147.      something.
  148.      
  149.           On countless occasions TV nature programs have treated
  150.      us to the sight of various sleek, furry, or spiny creatures
  151.      busily spraying the foliage or tree trunks around them with
  152.      their own personal scent.  And we have also heard omniscient
  153.      narrators inform us that the purpose of this spray is to
  154.      mark the creature's territory against competitors, fend off
  155.      predators, and/or attract mates.  And we have also seen the
  156.      face-offs, battles, retreats, and matings that these spray
  157.      marks have incited.
  158.      
  159.           In an evolutionary perspective covering all species and
  160.      ranging through millions of years, it has been abundantly
  161.      shown time and time again--as tails recede, stomachs develop
  162.      second and third chambers, and reproduction methods
  163.      proliferate--that a function working in one way for one
  164.      species may come to work quite differently in another.  Is
  165.      it really too absurd to suggest that over a period of a few
  166.      million years the spraying mechanism common to so many
  167.      mammals, employing relatively small posterior muscles and
  168.      little brain power, may have wandered off and found its
  169.      place within a single species, which chose to use larger
  170.      muscles located in the head and lungs, guiding them with a
  171.      vast portion of its brain?
  172.      
  173.           This is not to demean human speech to the level of mere
  174.      animal sprayings or to suggest that language does not also
  175.      possess other more abstract properties.  But would not such
  176.      an evolution explain much about how human beings still use
  177.      language today?  Do we really require "scientific" evidence
  178.      for such an assertion, when so many proofs lie self-
  179.      evidently all around us?  One proof is that human beings do
  180.      not normally use their nether glands to spray a fine scent
  181.      on their surroundings, assuming they could do so through
  182.      their clothing.  They do, however, undeniably talk at and
  183.      about everything, real or imagined.  It is also clear that
  184.      speech bears a remarkable resemblance to spray, so much so
  185.      that it is sometimes necessary to stand at a distance from
  186.      some interlocutors. (1)
  187.      
  188.            Would not such an evolution aptly explain the
  189.      attitudes of many "literal-minded" people, who insist on a
  190.      single interpretation of specific words, even when it is
  191.      patiently explained to them that their interpretation is
  192.      case-dependent or simply invalid?  Does it not clarify why
  193.      many misunderstandings fester into outright conflicts, even
  194.      physical confrontations?  Assuming the roots of language lie
  195.      in territoriality, would this not also go some distance
  196.      towards clarifying some of the causes of border disputes,
  197.      even of wars?  Perhaps most important of all, does such a
  198.      development not provide a physiological basis for some of
  199.      the differences between languages, which themselves have
  200.      become secondary causes in separating peoples?  Would it not
  201.      also permit us to see different languages as exclusive and
  202.      proprietary techniques of spraying, according to different
  203.      "nozzle apertures," "colors," or viscosity of spray?  Could
  204.      it conceivably shed some light on the fanaticism of various
  205.      forms of religious, political, or social fundamentalisms?
  206.      Might it even explain the bitterness of some scholarly
  207.      feuding?
  208.      
  209.      Of course there is more to language than spray, as the
  210.      species has sought to demonstrate, at least in more recent
  211.      times, by attempting to preserve a record of their sprayings
  212.      in other media, such as stone carvings, clay imprints,
  213.      string knottings, and of course scratchings on tree barks,
  214.      papyri, and different grades of paper, using a variety of
  215.      notations based on characters, syllabaries or alphabets, the
  216.      totality of this quest being known as "writing."  These
  217.      strivings have in turn led to the development of a variety
  218.      of knowledge systems, almost bewildering in their number and
  219.      diversity of styles, slowly merging and dissolving
  220.      through various eras and cultures in a multi-dimensional,
  221.      quasi-fractal continuum.  Thus, language may turn out to be
  222.      something we have created not as a mere generation or
  223.      nation, not even as a species, but in Von Baer's sense as an
  224.      entire evolutionary phylogeny.  It is this greater
  225.      configuration which may transcend the more primitive side of
  226.      language and eventually provide a more complete image of its
  227.      nature, perhaps even shedding light as well on the nature of
  228.      human knowledge itself.
  229.      
  230.           In the face of this imposing prospect, it is not
  231.      surprising that MT advocates almost invariably focus on that
  232.      part of language devoted to "verbal meaning."  But I have
  233.      listed elsewhere no less than five other common functions of
  234.      language, almost none of them totally devoted to the
  235.      communication of verbal meaning.  They are as follows:
  236.      
  237.                1.  Demonstrating one's class status to the person
  238.      one is speaking or writing to.
  239.      
  240.                2.  Simply venting one's emotions, with no real
  241.      communication intended.
  242.      
  243.                3.  Establishing non-hostile intent with
  244.      strangers, or simply passing time with them.
  245.      
  246.                4.  Telling jokes.
  247.      
  248.                5.  Engaging in non-communication by intentional
  249.      or accidental ambiguity, sometimes also called `telling
  250.      lies.'
  251.      
  252.                6, 7, 8, etc.  Two or more of the above (including
  253.      communication) at once. (2)
  254.      
  255.           It should be obvious that most of the foregoing conform
  256.      at least as well to the model of "spraying one's
  257.      surroundings" as they do to communicating verbal meaning as
  258.      such.  It is hard to see how MT can ever hope to cope with
  259.      these larger problems, and it is not surprising that we have
  260.      recently seen various limitations arise connected with
  261.      launching, marketing and publicizing commercial MT products
  262.      as well as with training translators to deal with MT output
  263.      as post-editors.(3)
  264.  
  265.      
  266.           Under no circumstances is this "spraying" metaphor
  267.      being presented as a total account of language.  This aspect
  268.      is considered quite briefly--among many other intellectually
  269.      more respectable analogies for language--in the forthcoming
  270.      ATA Scholarly Volume on Terminology, and the author hopes to
  271.      provide an even more rounded account in a work still being
  272.      completed.  It does seem important, however, that some
  273.      relatively primitivist footnote to the origins of language
  274.      should be introduced into discussions about linguistics and
  275.      its applications, MT among them.  Much writing about
  276.      language--since it is scarcely uneducated people who write
  277.      about this subject to begin with--tends to luxuriate in
  278.      self-importance and self-congratulation about how important
  279.      a development language has been for humanity.  But the
  280.      rational and intellectual aspects of language are in a sense
  281.      only the most obvious ones, which may have led MT advocates,
  282.      perhaps following Chomsky, to suppose language possesses a
  283.      logical substructure it may in many cases actually lack.
  284.      
  285.           Contrasted with these more complex aspects of language,
  286.      a good computer program should be a model of simplicity.  It
  287.      should solve its problem in the most elegant way and--as
  288.      though following the thread of Ariadne--it should go
  289.      directly to its goal and craftily find its way out of the
  290.      labyrinth again, easily slaying or avoiding all minotaurs
  291.      and monsters along the way and using its thread as a guide
  292.      rather than tripping over it as an obstacle.  If it must
  293.      double back occasionally in its path, there are good and
  294.      cogent rules for not letting this prove a distraction.  It
  295.      is thus not surprising that the labyrinth or maze is an
  296.      image that finds instinctive resonance among hackers,nor
  297.      that they take delight in playing games where monsters must
  298.      be slain.
  299.      
  300.           But what computer rules will guide us through the
  301.      labyrinth of language?  There is no one entrance or exit and
  302.      no definable center.  We have all had to learn this
  303.      labyrinth step by step simply to come as far as we have.  We
  304.      have even learned about the computer--up to a fairly
  305.      advanced point--mainly by using language.  When we try to
  306.      solve the problems of language, whether by building MT
  307.      programs or Voice-Writers or other Natural Language
  308.      applications, we suddenly find there are monsters
  309.      everywhere, and it is they who slay us, rather than the
  310.      reverse.  The technique for slaying one language monster may
  311.      allow another to triumph.  And the thread itself no longer
  312.      traces a brief or  elegant path, it has in fact become
  313.      endless in its back-trackings and recrossings, creating a
  314.      whole new jungle of Koenigsberg Bridges, Towers of Hanoi,
  315.      Traveling Salesman's Problems, and other computer math
  316.      anomalies.  Worst of all, the labyrinth of language is not
  317.      some separate location we can visit at our convenience and
  318.      slowly come to know.  Rather, we have no choice but to live
  319.      in it constantly.  We have never lived anywhere else.
  320.      
  321.           Perhaps it is time to glance backwards from a systems
  322.      perspective and see how well language has conformed to our
  323.      nine-point profile for a technology.  Clearly no survey of
  324.      need or technological feasibility can have taken place in
  325.      the conventional sense.  Nor was financing or research and
  326.      development a major factor, since a whole succession of
  327.      species was available as a free laboratory over several
  328.      million years.  But at the right time, language came to be
  329.      installed in the entire human race, at first only spoken but
  330.      finally written as well.  It was clearly a technological
  331.      advance, since it made it possible for humans, even in its
  332.      oral form, to exchange more complex observations and
  333.      measurements than could be passed along without it.  Perhaps
  334.      most impressive of all, language now has a total installed
  335.      base of over five billion living systems, something no
  336.      computer can remotely match, and is still expanding.  Its
  337.      one main drawback as a technology may lie in the huge
  338.      service and administrative staff of teachers, writers,
  339.      editors, and critics needed to maintain it, though a
  340.      comparable problem is not unknown with computers.
  341.      
  342.           At computer conferences one frequently hears
  343.      programmers and other specialists complaining about natural
  344.      language and boasting about how they live in a purer, more
  345.      perfect sphere, in a truer reality, whether virtual or
  346.      otherwise.  One day they will supplant all the confusing
  347.      skeins of messy reality and even messier language with a
  348.      finer, higher, texture of purest logic, and all the world
  349.      will instantly evolve to the next more transcendent stage.
  350.      Those who voice these boasts have but a single problem: for
  351.      the time being at least, they are forced to express their
  352.      vision in precisely the natural language they claim to
  353.      despise.  To perfect MT or any natural language application,
  354.      there is no escaping the fact that it will be necessary to
  355.      build a language both higher and lower, in human and
  356.      computer terms respectively, than the one we now use, a true
  357.      metalanguage.  There is room for a great deal of skepticism
  358.      as to whether this is possible.
  359.      
  360.           I am not so sanguine as to hope that the foregoing will
  361.      have any effect at all on MT zealots, Hal AI acolytes, or
  362.      dedicated programmers. (4)  Like heroes of old intent on
  363.      slaying the foe at any cost, they pay heed only to news of
  364.      the latest new weapon alleged to have power against the
  365.      minotaur.  It may be called Corpus-Based MT, or Neural Nets,
  366.      or Hidden Markov Models, or Three-Dimensional Fuzzy Logic,
  367.      or perhaps it may hinge on creating a neurological interface
  368.      with the brain itself.  Or it may simply be a matter of
  369.      time--after all, when computers become sufficiently large
  370.      and inexpensive, nothing will be beyond their power, or so
  371.      goes the tale.  But without a complete algorithm for
  372.      handling language and linguistic problems, not all the power
  373.      in the universe can withstand the might of the great God
  374.      GIGO: Garbage In, Garbage Out.
  375.      
  376.           Some of these approaches may bring some advances to
  377.      some aspects of MT.  But programmers, AI enthusiasts, and MT
  378.      researchers alike would do well to realize that they too
  379.      live in the labyrinth of language, a realm whose
  380.      navigational problems have long been underestimated.
  381.      
  382. ________________________________________________________
  383.  
  384. NOTES:
  385.         1.  This resemblance extends even to the etymology of the
  386.      two words, speech and spray, which are closely related in
  387.      the Indo-European family, as are a variety of words
  388.      beginning with "spr-" or "sp-" related to spraying and
  389.      spreading: Engish/German spread, sprawl, spray, sprinkle,
  390.      sp(r)eak, spit, spurt, spout, Spreu, spritzen, Sprudel,
  391.      Spucke, spruehen, sprechen, Dutch spreken, Italian sprazzo,
  392.      spruzzo, Russian rasprostranyat', raspryskat', Latin,
  393.      spargo, Ancient Greek spendo, speiro, etc.  The presence of
  394.      the mouth radical in the Chinese characters for "spurt,"
  395.      "spit," "language," and "speak" also shows how related these
  396.      concepts are on a cross-cultural level.   
  397.  
  398.         2.  From the author's The Limitations of Computers As
  399.      Translation Tools, a chapter from Computers in Translation:
  400.      A Practical Appraisal, Routledge, London, 1992.
  401.      
  402.         3.  Peter Wheeler: On Using Professional Translators to
  403.      Post-Edit, pp. 353-59, Looking Ahead, Proceedings of the
  404.      31st Annual Conference of the American Translators
  405.      Association, Edited by A. Leslie Willson, Learned
  406.      Information, Inc, 1990.
  407.  
  408.         4  I wish there were some way both programmers and
  409.      translators could become aware of their many similarities.
  410.      Both work at extremely demanding intellectual tasks
  411.      requiring a high level of familiarity with specialized
  412.      knowledge.  Both tend to live somewhat solitary lives,
  413.      punctuated by moments of self-indulgence.  Both are beset by
  414.      constant deadlines, and both are reputed to be something of
  415.      drones.  While the programmer often purports to despise
  416.      language and sees himself as living in "Cyberspace," the
  417.      translator may feel hostile towards computer logic while
  418.      setting up an almost mystical relationship with his
  419.      dictionaries and envisioning  himself as dwelling in a realm
  420.      where reality and meaning meet.  Perhaps both are mistaken
  421.      in somewhat similar ways.
  422.  
  423.                     Copyright 1993 and 1995 by Alexander Gross
  424.  
  425.                            This piece may be reproduced for
  426.                            individuals and for educational
  427.                            purposes.  It may not be used for
  428.                            any commercial (i.e., money-making)
  429.                            purpose without written permission
  430.                            from the author.
  431.  
  432.  
  433.  
  434.  
  435.  
  436.  
  437.  
  438.  
  439.  
  440.  
  441.  
  442.  
  443.  
  444.  
  445.  
  446.  
  447.  
  448.  
  449.  
  450.  
  451.  
  452.  
  453.  
  454.  
  455.  
  456.  
  457.  
  458.  
  459.  
  460.  
  461.  
  462.  
  463.